Lexique
Posted on avril 01, 2019 in computer-science
Lexique382 est une base de données lexicales du français qui fournit pour ~140000 mots du français: les représentations orthographiques et phonémiques, les lemmes associés, la syllabation, la catégorie grammaticale, le genre et le nombre, les fréquences dans un corpus de livres et dans un corpus de sous-titres de filems, etc.
J'ai créé, avec mon collègue Boris New, le site http://www.lexique.org qui utilise un serveur shiny pour permettre un accès facile à la base.
Le code source du serveur, ainsi que différents scripts permettant de manipuler les bases de données lexicales, est disponible sur GitHub à https://chrplr.github.io/openlexicon/